检索结果

Select

1. 基于离散哈希的聚类

轩书婷, 刘惊雷

《计算机应用》唯一官方网站 2022, 42 (3): 713-723. DOI: 10.11772/j.issn.1001-9081.2021040911

摘要（255）

HTML （8）

PDF （1072KB）（137）

传统的聚类方法是在数据空间进行，且聚类数据的维度较高。为了解决这两个问题，提出了一种新的二进制图像聚类方法——基于离散哈希的聚类（CDH）。该框架通过 $L 21$ 范数实现自适应的特征选择，从而降低数据的维度；同时通过哈希方法将数据映射到二进制的汉明空间，随后，在汉明空间中对稀疏的二进制矩阵进行低秩矩阵分解，完成图像的快速聚类；最后使用可以快速收敛的优化方案来对目标函数进行优化求解。在Caltech101、Yale、COIL20、ORL图像数据集上的实验结果表明，该方法可以有效提升聚类效率。在Caltech101数据集的Gabor视图，与传统的K-means、谱聚类方法相比，在处理高维度数据时，CDH的时间效率分别提高了约87和98个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 基于Dandelion编码生成有界树宽CP-nets

李丛丛, 刘惊雷

计算机应用 2021, 41 (1): 112-120. DOI: 10.11772/j.issn.1001-9081.2020060972

摘要（250）

PDF （1221KB）（755）

针对条件偏好网络（CP-nets）图模型在进行推理运算时的高时间复杂度的问题，提出了一种基于Dandelion编码生成有界树宽的CP-nets（BTW-CP-nets Gen）算法。首先，通过Dandelion编码与树宽为 k的树结构（ k-tree）之间的双向映射原理推导出Dandelion编码与 k-tree之间的解码与编码算法，实现编码与树结构的一对一映射；其次，利用 k-tree来约束CP-nets结构的树宽，并利用 k-tree的特征树得到了CP-nets的有向无环图结构；最后，利用离散多值函数的双射计算出各CP-nets结构节点的条件偏好表，然后针对生成的有界树宽CP-nets进行占优查询检测。理论分析和实验数据表明，与Pruffer编码生成 k-tree（Pruffer code）算法相比，BTW-CP-nets Gen算法的运行时间在生成简单结构和复杂结构时的下降幅度分别为21.1%和30.5%；而BTW-CP-nets Gen算法所生成的图模型在进行占优查询时的节点遍历比在简单结构和复杂结构上分别提高了18.48%和29.03%。BTW-CP-nets Gen算法在更短的时间内，占优查询时遍历的节点率更高。可见，BTW-CP-nets Gen算法在图模型的推理中能够有效提高算法效率。

参考文献 | 相关文章 | 多维度评价

Select

3. 单调重叠联盟下的最优联盟结构生成

郭志鹏, 刘惊雷

计算机应用 2021, 41 (1): 103-111. DOI: 10.11772/j.issn.1001-9081.2020060973

摘要（265）

PDF （1073KB）（396）

针对重叠联盟的合作博弈框架（OCF games）中重叠联盟结构生成（OCSG）求解困难的问题，提出了一种基于贪心方法的有效算法。首先使用了一种带有联盟数量 k约束的OCF博弈（kOCF games）模型来限制OCSG问题的规模；然后引入了一种相似度量来表示任意两个联盟结构之间的相似程度，并基于相似度量定义了单调性的性质，这意味着某一联盟结构与最优联盟结构的相似度越高，该联盟的单调性的值就越大；最后对于具有单调性质的kOCF博弈，采用了逐一插入玩家编号以逼近最优联盟结构的方法设计了联盟约束贪心（CCG）算法来求解给定的OCSG问题，并在理论上证明了CCG算法的复杂度是 O（ n2 ^k+1）。通过实验分析和验证了不同参数和联盟值分布对所提算法性能的影响，并把该算法与Zick等提出的算法（ZICK Y，CHALKIADAKIS G，ELKIND E，et al. Cooperative games with overlapping coalitions： charting the tractability frontier. Artificial Intelligence，2019，271：74-97）在约束条件等方面进行了对比，得出了当联盟最大数量 k被常数约束时所提算法的搜索次数随agent的个数基本呈线性增长的结果。可见CCG算法是固定参数 k可解的，而且拥有更好的适用性。

参考文献 | 相关文章 | 多维度评价

Select

4. 无需特征分解的快速谱聚类算法

刘静姝, 王莉, 刘惊雷

计算机应用 2020, 40 (12): 3413-3422. DOI: 10.11772/j.issn.1001-9081.2020061040

摘要（410）

PDF （1407KB）（510）

为了解决样本数较大时，传统谱聚类算法执行特征分解消耗时间过大的问题，提出了一种无需特征分解的快速谱聚类算法，通过乘法更新迭代来降低时间开销。首先，利用Nyström方法进行随机采样，建立了采样矩阵和原始矩阵之间的关系；其次，基于乘法更新原理实现矩阵指示器矩阵的迭代更新；最后，在理论上对所设计算法进行了正确性和收敛性分析。在广泛使用的五个真实数据集和三个人工合成数据集上进行测试。实验结果表明，在真实数据集上，所提算法的标准互信息（NMI）平均值为0.45，与 k-means聚类算法相比提高了12.50%；运行时间为61.73 s，与传统谱聚类算法相比减少了61.13%；而且表现性能优于层次聚类算法，验证了该算法的有效性。

参考文献 | 相关文章 | 多维度评价

Select

5. 基于Nyström方法的偏好特征提取

杨美姣, 刘惊雷

计算机应用 2018, 38 (9): 2515-2522. DOI: 10.11772/j.issn.1001-9081.2018020296

摘要（635）

PDF （1373KB）（298）

针对电影评分中特征提取效率较低的问题，提出了与QR分解相结合的Nyström方法。首先，利用自适应方法进行采样，然后对内部矩阵进行QR分解，将分解后的矩阵与内部矩阵进行重新组合并进行特征分解。Nyström方法的近似过程与标志点选取的数量以及选取标志点的过程密切相关，选取一系列具有标志性的点来保证采样后的近似性，自适应的采样方法能够保证近似的精度。QR分解能够保证矩阵的稳定性，提高偏好特征提取的精度。偏好特征提取的精度越高，推荐系统的稳定性就会越高，推荐的精度也会提高。最后在真实的观众对电影评分的数据集上进行了特征提取的实验，该电影数据集中包含480189个用户，17770部电影，实验结果表明，提取相同数目的标志点时，该算法的精度和效率都有了一定程度的提高：相对于采样前，时间复杂度由原来的 O（ n ³）减少为 O（ nc ²）（ c<< n）；与标准的Nyström相比，误差控制在25%以下。

参考文献 | 相关文章 | 多维度评价

Select

6. 利用CUR矩阵分解提高特征选择与矩阵恢复能力

雷恒鑫, 刘惊雷

计算机应用 2017, 37 (3): 640-646. DOI: 10.11772/j.issn.1001-9081.2017.03.640

摘要（573）

PDF （1235KB）（424）

针对在规模庞大的数据中不能快速准确地选择用户和产品的特征以及不能准确预测用户行为偏好的问题，提出一种CUR矩阵分解方法。该方法是从原始矩阵中选取少量列构成 C矩阵，选取少量行构成 R矩阵，然后利用正交三角分解（QR）构造 U矩阵。分解后的 C矩阵和 R矩阵分别是用户和产品的特征矩阵，并且 C和 R矩阵是由真实的数据构成的，因此能够分析出具体的用户和产品特征；为了能够比较准确地预测用户的行为偏好，改进了CUR算法，使其在矩阵恢复方面有更高的稳定性和准确性。最后在真实的数据集（Netflix数据集）上的实验表明，与传统的奇异值分解、主成分分析等矩阵分解方法相比：在特征选择方面，CUR矩阵分解方法具有较高的准确度和很好的可解释性；在矩阵恢复方面，改进的CUR矩阵分解方法具有较高的稳定性和精确度，其准确度能达到90%以上。CUR矩阵分解在推荐系统对用户的推荐方面和交通系统预测交通流量方面有重要的应用价值。

参考文献 | 相关文章 | 多维度评价

Select

7. 基于最大团的条件偏好挖掘

谭征, 刘惊雷, 余航

计算机应用 2017, 37 (11): 3107-3114. DOI: 10.11772/j.issn.1001-9081.2017.11.3107

摘要（456）

PDF （1274KB）（545）

针对在数据库的个性化查询中条件约束（或上下文约束）没有被充分考虑的问题，首先提出了条件约束模型i ⁺≻i ^-| X，它表示在上下文 X的约束下，相对于i ^-，用户更偏好i ⁺。在此模型的基础上，采用最大团（MaxClique）关联规则算法挖掘获得用户偏好；随后又提出了条件偏好挖掘（CPM）算法，该算法结合上下文用于挖掘偏好规则，从而得出用户的偏好。实验结果表明，基于CPM算法的偏好挖掘模型具有较强的偏好表达能力，将CPM算法与基于Apriori的算法以及CONTENUM算法进行了实验对比，实验的主要参数为最小支持度、最小可信度、数据规模等，实验结果进一步表明所提出的CPM算法可明显提高用户偏好规则的产生效率。

参考文献 | 相关文章 | 多维度评价

Select

8. 从偏好数据库中挖掘Ceteris Paribus偏好

辛冠琳, 刘惊雷

计算机应用 2016, 36 (8): 2092-2098. DOI: 10.11772/j.issn.1001-9081.2016.08.2092

摘要（375）

PDF （1198KB）（450）

针对传统的推荐系统需要用户给出明确的偏好矩阵（U-I矩阵），进而使用自动化技术来获取用户偏好的问题，提出了一种从偏好数据库中挖掘出Agent的偏好信息的方法。从知识发现的角度，通过Ceteris Paribus规则（CP规则），提出了 k阶偏好挖掘算法（ kPreM）。在算法中，利用 k阶CP规则对偏好数据库中的信息进行剪枝处理，减少了数据库扫描次数，从而提高了偏好信息的挖掘效率。随后以一种通用的图模型——条件偏好网（CP-nets）为工具，揭示了用户的偏好可近似表达为CP-nets的定性条件偏好网。实验结果表明，用户的偏好都是带有条件的偏好。另外，通过挖掘得出的CP-nets偏好模型，为设计个性化的推荐系统提供了理论基础。

参考文献 | 相关文章 | 多维度评价

Select

9. CCML2017+156+基于最大团的条件偏好挖掘

谭征刘惊雷余航

录用日期: 2017-06-07